Biến thể di truyền là gì? Các nghiên cứu khoa học liên quan
Biến thể di truyền là sự khác biệt trong trình tự DNA giữa các cá thể cùng loài, có thể ảnh hưởng đến kiểu hình, chức năng sinh học hoặc nguy cơ bệnh tật. Chúng tồn tại ở nhiều dạng như SNP, indel, CNV hay SV và đóng vai trò quan trọng trong tiến hóa, di truyền bệnh và y học cá thể hóa.
Định nghĩa biến thể di truyền
Biến thể di truyền (genetic variation) là những khác biệt trong trình tự DNA giữa các cá thể trong cùng một loài, xảy ra tự nhiên qua quá trình sao chép, đột biến hoặc tái tổ hợp. Đây là yếu tố trung tâm tạo nên sự đa dạng sinh học và là cơ sở di truyền của sự tiến hóa và chọn lọc tự nhiên.
Biến thể có thể xuất hiện tại bất kỳ vị trí nào trong hệ gen — trong vùng mã hóa (exon), vùng điều hòa (promoter, enhancer), vùng không mã hóa (intron, UTR) hoặc vùng giữa các gen (intergenic). Chúng có thể ảnh hưởng đến chức năng gen hoặc không có tác động sinh học đáng kể.
Một số biến thể là di truyền (germline) và được truyền từ thế hệ này sang thế hệ khác, trong khi những biến thể khác chỉ xuất hiện trong tế bào soma (somatic) và không di truyền, thường gặp trong ung thư hoặc bệnh lý tích lũy.
Các loại biến thể di truyền
Các biến thể di truyền được phân loại dựa trên bản chất cấu trúc và độ dài đoạn DNA bị ảnh hưởng. Trong các nghiên cứu di truyền hiện đại, năm nhóm chính bao gồm:
- Biến thể đơn nucleotide (SNP): Thay đổi một base đơn duy nhất — ví dụ A thành G
- Indel: Chèn (insertion) hoặc xóa (deletion) từ 1 đến 50 base
- Copy Number Variation (CNV): Tăng hoặc giảm số bản sao của đoạn DNA dài hơn 50 bp
- Biến thể cấu trúc (SV): Đảo đoạn, chuyển đoạn, lặp đoạn hoặc mất đoạn lớn
- Biến thể số lượng toàn nhiễm sắc thể: Thường gây bệnh di truyền nặng (ví dụ: tam bội nhiễm sắc thể 21 gây Down)
Dưới đây là bảng so sánh đặc điểm cơ bản của một số loại biến thể:
Loại biến thể | Kích thước | Tần suất trong hệ gen người | Tác động sinh học |
---|---|---|---|
SNP | 1 bp | ~1/1000 base | Có thể ảnh hưởng đến mã hóa hoặc điều hòa |
Indel | 1–50 bp | Ít phổ biến hơn SNP | Có thể gây lệch khung đọc (frameshift) |
CNV | >50 bp | Phân bố không đồng đều | Tăng/giảm lượng protein, ảnh hưởng điều hòa gen |
Biến thể di truyền và biểu hiện kiểu hình
Biến thể di truyền có thể ảnh hưởng trực tiếp đến kiểu hình cá thể — bao gồm đặc điểm hình thái, sinh lý và nguy cơ bệnh tật. Ví dụ, SNP trong vùng mã hóa gen quy định sắc tố da có thể dẫn đến sự khác biệt màu da giữa các quần thể.
Biến thể ở vùng exon có thể tạo ra đột biến sai nghĩa (missense), vô nghĩa (nonsense) hoặc không thay đổi axit amin (silent). Đột biến sai nghĩa có thể làm biến đổi chức năng hoặc cấu trúc của protein. Đột biến vô nghĩa có thể tạo codon kết thúc sớm dẫn đến protein không hoàn chỉnh.
Biến thể ngoài vùng mã hóa — ví dụ ở promoter hoặc enhancer — có thể thay đổi cường độ biểu hiện gen thông qua tác động đến yếu tố phiên mã hoặc cấu trúc nhiễm sắc thể. Những biến thể này dù không thay đổi cấu trúc protein nhưng lại ảnh hưởng đến mức độ biểu hiện.
Biến thể di truyền và bệnh lý
Nhiều rối loạn di truyền đơn gen là kết quả của các biến thể có tác động chức năng mạnh. Ví dụ: Đột biến trong gen HBB gây bệnh thiếu máu hồng cầu hình liềm do thay đổi cấu trúc hemoglobin.
Đối với các bệnh phức tạp như tiểu đường, bệnh tim mạch hoặc rối loạn thần kinh, mỗi biến thể chỉ đóng góp một phần nhỏ vào nguy cơ chung. Do đó, cần đến phân tích đa biến và mô hình hóa nguy cơ di truyền tổng hợp (polygenic risk score).
Các cơ sở dữ liệu như ClinVar lưu trữ hàng trăm nghìn biến thể có liên quan bệnh lý, được xác định qua các nghiên cứu lâm sàng và mô hình hóa chức năng.
Đo lường và phát hiện biến thể
Phát hiện biến thể di truyền dựa trên dữ liệu giải trình tự DNA là bước then chốt trong nghiên cứu gen học và y học cá thể hóa. Các công nghệ phổ biến hiện nay bao gồm:
- Giải trình tự thế hệ mới (NGS): Cho phép thu nhận hàng triệu đoạn đọc ngắn, áp dụng trong WES (Whole Exome Sequencing) và WGS (Whole Genome Sequencing)
- SNP microarray: Phát hiện biến thể phổ biến (SNP) với chi phí thấp, độ phủ thấp hơn WGS
- Long-read sequencing: Sử dụng công nghệ như PacBio, Oxford Nanopore để phát hiện biến thể cấu trúc (SV, CNV)
Sau giải trình tự, các thuật toán gọi biến thể (variant calling) như GATK HaplotypeCaller hoặc DeepVariant được sử dụng để xác định vị trí, kiểu và đặc tính của biến thể. Các biến thể sau đó được chú thích chức năng bằng công cụ như ANNOVAR hoặc VEP.
Hướng dẫn thực hành: Broad Institute - GATK Best Practices
Đa hình di truyền và nghiên cứu GWAS
Biến thể di truyền được phân loại thành phổ biến (MAF > 1%) và hiếm (MAF < 1%). Những biến thể phổ biến (polymorphism) thường không gây bệnh trực tiếp nhưng liên quan đến nguy cơ bệnh qua nghiên cứu GWAS (Genome-Wide Association Studies).
GWAS khảo sát hàng triệu SNP trên toàn hệ gen ở hàng ngàn người để xác định các vị trí liên quan thống kê đến bệnh hoặc tính trạng. Phân tích này sử dụng hồi quy logistic hoặc mô hình tuyến tính với kiểm định giả thuyết:
Các phát hiện GWAS đóng vai trò quan trọng trong xây dựng chỉ số nguy cơ đa biến (polygenic risk score) cho các bệnh như tiểu đường type 2, Alzheimer, hoặc bệnh tim mạch.
Ảnh hưởng của biến thể lên phiên mã và dịch mã
Biến thể có thể ảnh hưởng đến mọi cấp độ của biểu hiện gen: phiên mã, xử lý RNA, dịch mã và phân hủy mRNA. Một số ví dụ:
- Promoter: SNP thay đổi điểm gắn yếu tố phiên mã (TFBS), làm tăng hoặc giảm phiên mã
- Splice site: Đột biến tại vị trí cắt-nối gây bỏ exon hoặc giữ intron
- UTR: Biến thể ở vùng 5' hoặc 3' UTR ảnh hưởng đến sự ổn định và hiệu quả dịch mã
- Codon: Đột biến sai nghĩa, vô nghĩa hoặc lệch khung đọc gây thay đổi protein
Các biến thể gây mất chức năng (loss-of-function) thường liên quan đến bệnh di truyền trầm trọng. WES được ưu tiên sử dụng để phát hiện đột biến ở vùng exon ảnh hưởng trực tiếp đến mã hóa protein.
Tương tác biến thể – môi trường
Không phải biến thể nào cũng gây tác động giống nhau ở mọi cá thể. Tác động của biến thể phụ thuộc vào môi trường sống, lối sống, chế độ ăn, stress, nhiễm trùng hoặc các yếu tố khác. Đây là trọng tâm của nghiên cứu tương tác gene – môi trường (GxE).
Ví dụ:
- Người mang allele nguy cơ của gen APOE ε4 có nguy cơ Alzheimer cao hơn nếu hút thuốc, ăn nhiều chất béo bão hòa
- Biến thể trong gen FTO liên quan đến béo phì chỉ biểu hiện khi năng lượng đầu vào cao hơn mức tiêu hao
Mô hình hóa tương tác này đòi hỏi các bộ dữ liệu lớn và phân tích thống kê mạnh, thường sử dụng hồi quy đa biến hoặc học máy.
Ứng dụng trong y học cá thể hóa
Các thông tin về biến thể di truyền đang thúc đẩy sự phát triển của y học cá thể hóa (precision medicine), trong đó điều trị và phòng bệnh được thiết kế theo hồ sơ gen cá nhân.
Các ứng dụng chính:
- Pharmacogenomics: Lựa chọn và liều dùng thuốc theo gen (ví dụ: gen TPMT trong điều trị ung thư máu)
- Dự đoán nguy cơ: Dựa vào chỉ số nguy cơ di truyền (PRS) từ hàng trăm biến thể
- Chẩn đoán trước sinh: Sàng lọc và phân tích biến thể ở phôi (PGT), hoặc thai nhi (NIPT)
Hệ cơ sở dữ liệu PharmGKB cung cấp thông tin cập nhật về các biến thể ảnh hưởng đến dược động học và dược lực học của thuốc.
Tài liệu tham khảo
- Strachan, T., & Read, A. (2018). Human Molecular Genetics (5th ed.). Garland Science.
- Visscher, P. M., et al. (2017). 10 years of GWAS discovery: Biology, function, and translation. Nature Reviews Genetics, 18(2), 113–130.
- Shendure, J., et al. (2017). DNA sequencing at 40: Past, present and future. Nature, 550(7676), 345–353.
- Manolio, T. A., et al. (2009). Finding the missing heritability of complex diseases. Nature, 461(7265), 747–753.
- National Human Genome Research Institute. Genetic Variation Glossary.
- GATK Best Practices. https://gatk.broadinstitute.org.
- PharmGKB. https://www.pharmgkb.org/.
Các bài báo, nghiên cứu, công bố khoa học về chủ đề biến thể di truyền:
- 1
- 2
- 3
- 4
- 5
- 6
- 10